# 2)产品所在区域对需求量的影响，以及不同区域的产品需求量有何特性；
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from scipy.stats import f_oneway
import scipy.stats as stats
# 读取数据
df = pd.read_csv('order_train1_new.csv')

# 绘制直方图
sns.histplot(x='ord_qty', hue='sales_region_code', data=df, kde=True,palette='bright')
# 设置 X 轴范围和刻度字体大小
plt.xlim(0, 750)
plt.xticks(range(0, 751, 250), fontsize=8)
plt.show()

plt.show()

# 绘制箱线图
sns.boxplot(x='sales_region_code', y='ord_qty', data=df)
plt.show()


# 进行ANOVA方差分析
grouped_data = df.groupby('sales_region_code')['ord_qty'].apply(list)

# 使用单因素方差分析算法
f_value, p_value = stats.f_oneway(*grouped_data)

print('F-value:', f_value)
print('P-value:', p_value)